通常用于分析复杂数据集的维度减少和聚类技术,但它们的结果通常不容易解释。我们考虑如何支持用户在散点图上解释视表位结构,其中轴不直接解释,例如使用维度减少方法将数据投射到二维空间上。具体地,我们提出了一种新方法来自动计算可解释的聚类,其中说明在原始的高维空间中,并且群集在低维投影中相干。它通过使用信息理论提供复杂性和所提供信息量之间的可调平衡。我们研究了这个问题的计算复杂性,并对解决方案的搜索空间引入了高效,可调,贪婪优化算法的限制。此外,该算法还在称为excus的交互式工具中实现。几个数据集的实验突出显示,excrus可以提供信息丰富的和易于理解的模式,并且他们公开了算法有效的地方,并且考虑到可调性和可扩展性的余地有改进的空间。
translated by 谷歌翻译